ab-preparation-donnees.Rmd
library(propre.rpls)
#> Error in get(paste0(generic, ".", class), envir = get_method_env()) :
#> object 'type_sum.accel' not found
Les premières fonctions du projet de publication bookdown sont dédiées à la création de l’environnement de travail. Voici comment elles fonctionnent.
La publication est paramétrée selon le nom d’une région. La fonction
get_id_reg()
permet de récupérer le code région
associé.
get_id_reg(nom_reg = "52 Bretagne")
#> [1] "52"
La fonction get_nom_reg()
permet de récupérer le
libellée région propre.
get_nom_reg(code_reg = "52 Bretagne")
#> [1] "Pays de la Loire"
La fonction fond_carto()
de mapfactory
prépare les fonds cartographiques spécifiques à la publication. Le fond
de carte EPCI rassemble tous les EPCI ayant au moins une commune dans la
région + les EPCI voisins qui entrent dans le cadre de la carte de la
région.
library(mapfactory)
carte_bretagne <- fond_carto("Bretagne")
plot(carte_bretagne$epci)
plot(carte_bretagne$departements)
La fonction get_fond_carto()
enrobe la fonction
fond_carto()
pour exporter son résultat lors d’une première
exécution, et le recharger lors d’une ré-exécution, au lieu de
télécharger à nouveau les fonds de cartes et de ré-exécuter les
calculs.
Il est nécessaire de ré-exécuter la fonction avec le paramètre
maj = TRUE
(mise à jour), en cas de dysfonctionnement, par
exemple suite à une mise à jour de {propre.rpls}
ou de
COGiter.
La fonction get_fond_carto()
accepte un paramètre
ombre
pour contrôler l’écartement (en mètres) de l’ombre
vis à vis du contour régional, par exemple
get_fond_carto(maj = TRUE, par_util = list(nom_region = "Bretagne"), ext_dir = ".", ombre = 3000)
A partir de la saisie utilisateur, la fonction
select_epci
crée la liste de tous les EPCI de la région si
choix 1, ou vérifie que les epci saisis en paramètres sont bien dans la
région si choix 2. Un EPCI est considéré comme appartenant à la région
si au moins une commune de l’EPCI est présente dans la région.
select_epci(nom_reg = "Bretagne", choix_epci = "1- Tous les EPCI de la zone", epci_list = NULL)
#> [1] "242900314" "243500139" "242900769" "244400610" "200068989" "242900801"
#> [7] "243500782" "200072452" "200067932" "200067981" "200069391" "200065928"
#> [13] "200042174" "242900835" "200068120" "242900694" "243500741" "200069409"
#> [19] "200039022" "200027027" "200043123" "200096675" "245600440" "200070662"
#> [25] "243500733" "243500618" "242900629" "200096683" "242900793" "243500725"
#> [31] "200070688" "245600465" "242900561" "200066785" "200038990" "242900645"
#> [37] "242900710" "242200715" "242900702" "242900074" "200070670" "242900751"
#> [43] "242900553" "242900660" "200067072" "200069086" "243500774" "200067460"
#> [49] "243500550" "200067197" "243500659" "200067247" "200066777" "242900744"
#> [55] "245614433" "200066868" "245614383" "243500634" "245614417" "243500667"
#> [61] "200043990"
select_epci(
nom_reg = "Pays de la Loire", choix_epci = "2- Liste d EPCI à saisir",
epci_list = c("244400404", "244400644")
)
#> [1] "244400404" "244400644"
Le jeu de données communal mis à disposition dans
{propre.rpls}
provient de l’enquête RPLS (millésimes 2014 à
2024 et du recensement de la population pour le nombre de résidences
principales. Les données du RP correspondent aux millésimes 2021 et
2015.
Les communes absentes de la source RPLS (c’est à dire qui ne comprennent pas de logements sociaux) sont présentes dans le jeu de données uniquement pour l’année 2024. Pour ces communes, seul le nombre de résidences principales est différent de zéro.
Les territoires à mettre en avant dans les illustrations sont
repérables par le booléen Zone_ref
.
indicateurs_rpls <- dataprep(nom_reg = "52 Pays de la Loire",
annee = 2023,
choix_epci = "2- Liste d EPCI à saisir",
epci_list = c("244400404", "244400644"))
indicateurs_rpls_illustrations <- indicateurs_rpls %>%
dplyr::filter(Zone_ref)
Ces territoires à mettre en avant comprennent les epcis choisis par l’utilisateur, les EPT de la Métropole du Grand Paris pour l’Ile de France, les départements de la région choisie (si elle en comporte plusieurs), la région choisie et deux totaux France qui diffèrent selon la localisation de la région choisie :
La fonction get_dataprep()
enrobe la fonction
dataprep()
pour exporter son résultat lors d’une première
exécution, et le recharger lors d’une ré-exécution, au lieu de
ré-exécuter les calculs qui peuvent prendre plus de 5 min.
Il est nécessaire de ré-exécuter la fonction avec le paramètre
maj = TRUE
(mise à jour) en cas de de mise à jour de
{propre.rpls}
(Correction des données de l’enquête,
amélioration de la fonction dataprep()
…) ou en cas de
modifications des paramètres utilisateurs comme la liste des EPCI de
détail, la région ou le millésime).
Si vous souhaitez éviter de filtrer le jeu d’indicateurs selon votre
région, des sous-fonctions ont été ajoutées à la fonction de
dataprep()
pour isoler certaines étapes.
La fonction dataprep()
accepte désormais un nom de
région vide (nom_reg = ""
) pour produire le jeu
d’indicateurs RPLS portant sur tous les territoires.
indicateurs_rpls_national <- dataprep(nom_reg = "", annee = 2023,
choix_epci = "1- Tous les EPCI de la zone")
La fonction centrer_dataset_reg()
ré-appliquée à ce jeu
d’indicateurs complet fournit le résultat utile pour une publication
régionale : elle retire les territoires inutiles pour la région et
recrée l’indicatrice booléenne Zone_ref
nécessaire au
fonctionnement des publications régionales.
indic_rpls_bretagne <- indicateurs_rpls_national %>%
centrer_dataset_reg(id_reg = "53", epci_choisis = "1- Tous les EPCI de la zone")